AI资讯新闻榜单内容搜索-Gemini

AI读网页，这次真不一样了，谷歌Gemini解锁「详解网页」新技能

谷歌回归搜索老本行，这一次，它要让 AI 能像人一样「看见」网页。这是谷歌前不久在 Gemini API 全面上线的 URL Context 功能（5 月 28 日已在 Google AI Studio 中推出），它使 Gemini 模型能够访问并处理来自 URL 的内容，包括网页、PDF 和图像。

来自主题: AI资讯

9242 点击 2025-09-02 16:06

Nano-Banana 核心团队首次揭秘，全球最火的 AI 生图工具是怎么打造的

在图像生成上，Google 其实已经有 Imagen 4 这样的文生图模型，为什么 nano banana 最后还是由 Google 带来的？但这确实不是偶然或者瞎猜的，nano banana 是结合了 Google 多个团队的项目成果。首先就是 Gemini 强大的世界知识与指令遵循能力，其次就是 Google 内部顶尖文生图模型 Imagen，所提供的极致图像美学与自然度追求。

来自主题: AI技术研报

11928 点击 2025-09-02 09:24

谷歌Nano Banana全网刷屏，起底背后团队

香蕉也能变礼服？Google 真的做到了！在最新一期谷歌开发者节目里，Google DeepMind 团队首次全面展示了 Gemini 2.5 Flash Image —— 一款拥有原生图像生成与编辑能力的最新模型。

来自主题: AI资讯

10150 点击 2025-08-29 16:48

Nano banana手办玩法火爆出圈！无需抽卡，效果惊了(°o°)

小某书最新起号方式，还得看AI（doge）。这两天打开一看，几乎全被各种精致逼真的手办图刷屏了

来自主题: AI资讯

9907 点击 2025-08-29 16:14

只需一块 4070，一个小时，Gemini 2.5 就能被黑产植入广告！

说个热知识，现在的大模型，也可以轻松被投广告了。我们之前也确实发现过这类现象，当时是在研究一家做 GEO（生成式引擎优化）的公司。通过在网上堆出大量正面内容，把某个特定品牌、网站、课程甚至微商产品，默默地塞进了大模型推荐结果里。

来自主题: AI技术研报

9029 点击 2025-08-29 16:01

谷歌认领最强AI版Photoshop！现在人人可用，效果确实强悍

爆火的神秘图像编辑模型nano-banana，终于脱掉了“香蕉皮”！就在今天，谷歌官方认领，并表明这个模型其实是Gemini 2.5 Flash Image。

来自主题: AI资讯

9526 点击 2025-08-27 17:57

谷歌「最强图像模型」横扫一切！Gemini 2.5 Flash Image正式上线！PS不存在了

Gemini 2.5 Flash Image是谷歌最新发布的顶级图像生成与编辑模型，被网友誉为「最强图像模型」。其化身nano-banana在LMArena盲测中以历史最大优势夺冠，凭借角色一致性、提示编辑、原生世界知识和多图像融合四大能力，引发广泛关注。

来自主题: AI资讯

9269 点击 2025-08-27 13:18

刚刚，大模型装上「鹰眼」！首创高刷视频理解，谷歌Gemini 2.5完败

刚刚，面壁智能再放大招——MiniCPM-V 4.5多模态端侧模型横空出世：8B参数，越级反超72B巨无霸，图片、视频、OCR同级全线SOTA！不仅跑得快、看得清，还能真正落地到车机、机器人等。这一次，它不只是升级，而是刷新了端侧AI的高度。

来自主题: AI技术研报

10219 点击 2025-08-27 13:05

为防AI刷题，Nature等顶刊最新封面被做成数据集，考验模型科学推理能力|上海交通大学

近年来，以GPT-4o、Gemini 2.5 Pro为代表的多模态大模型，在各大基准测试（如MMMU）中捷报频传，纷纷刷榜成功。

来自主题: AI技术研报

9113 点击 2025-08-26 10:41

三个月、零基础手搓一块TPU，能推理能训练，还是开源的

对于计算任务负载来说，越是专用，效率就越高，谷歌的 TPU 就是其中的一个典型例子。它自 2015 年开始在谷歌数据中心部署后，已经发展到了第 7 代。目前的最新产品不仅使用了最先进的制程工艺打造，也在架构上充分考虑了对于机器学习推理任务的优化。TPU 的出现，促进了 Gemini 等大模型技术的进展。

来自主题: AI资讯

8825 点击 2025-08-25 12:23